Wikimedia-Commons-Kategorien auslesen und mit einer METS/MODS-Datei im DFG-Viewer anzeigen

Zur Abwechslung diesmal ein technischer Blogbeitrag als Ergebnis eines kleinen wochenendlichen Projekts mit der Herausforderung, die auf Wikimedia Commons hochgeladenen Digitalisate der im vorigen Beitrag vorgestellten Satzung formvollendet im DFG-Viewer zu präsentieren.

Der hierzulande bei Bibliotheken und Archiven einigermaßen verbreitete DFG-Viewer ermöglicht die unkomplizierte Anzeige von Digitalisaten aus dezentralen Repositorien. Mit ihm lässt sich eine vereinheitlichte Präsentationsoberfläche zur Ansicht von digitalisierten Medien bereithalten, ohne eine lokale Präsentationssoftware installieren oder betreiben zu müssen. Zur Implementierung genügt es, beim Aufruf unter https://dfg-viewer.de als URL-Parameter den Link auf eine lokale XML-Datei mit der technischen Kodierung des anzuzeigenden Digitalisat im standardisierten METS/MODS-Format zu übergeben, z.B. https://dfg-viewer.de/show?tx_dlf[id]=https://vermessungs-bibliothek.de/dvw-satzung-1935.xml. Mit korrekter URL-Kodierung sieht das dann etwas kryptischer aus: https://dfg-viewer.de/show?tx_dlf%5Bid%5D=https%3A%2F%2Fvermessungs-bibliothek.de%2Fdvw-satzung-1935.xml.

Die referenzierte XML-Datei kann dabei beliebige Links auf Bilddateien enthalten. Wo die darzustellenden Bilddateien liegen, ist dem DFG-Viewer vollkommen egal. Einzige Voraussetzung ist die Erreichbarkeit der Digitalisate im Internet. Was liegt da näher, als gleich zwei Fliegen mit einer Klappe zu schlagen: Nämlich die interessierenden Scans/Digitalisate nicht (nur) auf der eigenen Website abzulegen, sondern gleich auf Wikimedia Commons hochzuladen und direkt von dort einzubinden.

Während die einzelnen Objektseiten der auf Commons hochgeladenen Bilder einem festen Schema folgen, ändert sich der Dateipfad der eigentlichen Bilddatei allerdings von mal zu mal, was die Sache ein wenig erschwert. Beispiel:
* commons.wikimedia.org/wiki/File:DVW-Satzung-1935-1.jpgupload.wikimedia.org/wikipedia/commons/b/b7/DVW-Satzung-1935-1.jpg
* commons.wikimedia.org/wiki/File:DVW-Satzung-1935-2.jpgupload.wikimedia.org/wikipedia/commons/5/58/DVW-Satzung-1935-2.jpg

Dank der unter www.mediawiki.org/wiki/API:Categorymembers dokumentierten Schnittstelle lassen sich die URLs der einer Kategorie zugeordneten Bilddateien aber relativ bequem abfragen. Der API-Call commons.wikimedia.org/w/api.php?action=query&generator=categorymembers&gcmtitle=Category:Satzung_des_Deutschen_Vereins_für_Vermessungswesen,_1935&gcmlimit=100&gcmtype=file&prop=imageinfo&iiprop=url liefert alle nötigen Daten. (Altenativ ließen sich die Unterverzeichnisse bei fester Dateinamenstruktur auch aus den ersten beiden Buchstaben des MD5-Hashwerts des jeweiligen Dateinamens ableiten, siehe commons.wikimedia.org/wiki/Commons:FAQ#What_are_the_strangely_named_components_in_file_paths?.)

Die Überführung des Abfrageergebnisses in das (z.B. hier bei der DDB) dokumentierte METS-Datenformat erledigt nun das folgende PHP-Skript: commets.php.

Mit drei Parametern lässt sich damit eine METS/MODS-Datei generieren, was man hier gleich mal ausprobieren kann:

Wikimedia-Commons-Kategory (ohne „Category:“):

Dateiname/ID (ohne Dateierweiterung „.xml“):

eigene Homepage (ohne „https://“):
       

Das Ergebnis sieht dann bspw. wie folgt aus: test.xml

Bevor man die per Skript erzeugte XML-Datei auf dem eigenen Webserver ablegt, muss man nur noch an den markierten Platzhaltern die entsprechenden bibliographischen Daten ergänzen oder z.B. die beiden Abschnitte zum FULLDOWNLOAD löschen, wenn kein Gesamt-PDF zum Download angeboten wird.

Aufgerufen wird das Ganze via dfg-viewer.de/show?tx_dlf[id]=https%3A%2F%2Fvermessungs-bibliothek.de%2Fdvw-satzung-1935.xml. Eine konkrete Seite lässt sich wie folgt ansprechen: dfg-viewer.de/show?tx_dlf%5Bid%5D=https%3A%2F%2Fvermessungs-bibliothek.de%2Fdvw-satzung-1935.xml&tx_dlf%5Bpage%5D=2

Zum vereinfachten Aufruf mit einem stabilen lokalen Kurzlink kann eine Weiterleitung wie hier view.php dienen, die dann im gleichen Verzeichnis wie die METS/MODS-Datei liegen muss. Damit lässt sich der DFG-Viewer auch wie folgt aufrufen: vermessungs-bibliothek.de/view.php?id=dvw-satzung-1935 bzw. mit Seitenangabe vermessungs-bibliothek.de/view.php?id=dvw-satzung-1935&s=2. In der METS/MODS-Datei stehen diese Kurzlinks im optionalen Parameter CONTENTIDS. Ebenfalls optional ist eine lokale Präsentation (<dv:presentation />), die hier mit dem Link zur Commons-Kategorie belegt wird.

Viel Spaß beim Nachmachen bzw. Nachnutzen!

Ein Gedanke zu „Wikimedia-Commons-Kategorien auslesen und mit einer METS/MODS-Datei im DFG-Viewer anzeigen

  1. Tolle Idee und schöne Umsetzung, ein gelungenes Beispiel um zu zeigen, wie das Verwenden von Wikimedia Commons als tatsächlich „offenes“ Medienrepositorium für GLAM-Institutionen auch im Kontext allgemeiner bzw. üblicher Infrastrukturen („DFG-Viewer“) genutzt werden kann. Denn Offenheit beschränkt sich nicht nur auf die Verfügbarkeit der Medien bzw. die Teilhabe an der Plattform, sondern erstreckt sich wie gezeigt auch an den Möglichkeiten der automatisierten Datenaufbereitung.

    Eine ergänzende Anregung noch: Schriften werden in Commons oft als mehrseitiges pdf oder djvu hochgeladen. (Insbesondere wenn eine Nachnutzung auf der Volltextplattform Wikisource geplant ist, ist das Verwenden einer einzelnen Datei etwas komfortabler). Commons zerlegt aber diese Dateien im Hintergrund in Einzelbilder und erlaubt diese ebenso über die API abzufragen. Das wäre toll, wenn aus einem Commons-PDF ein METS erzeugt werden könnte, welches auf die einzelnen physischen Seitenbilder referenziert.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert